LF AI&Data 基金会主席孟伟:大模型开源与商业化仍处模糊地带
【CSDN 编者按】大模型的加速发展,让更多共有问题浮出水面,开源大模型的商业化之路该怎么走?何种开源协议能够达成共识,有助于推动其向前发展?在标准与开源领域深耕十余年,如今又肩负 LF AI & Data 董事会主席重任的孟伟非常渴望带大家找到答案。
孟伟先生,中兴通讯股份有限公司开源战略总监。从 2016 年开始,他就牵头中兴通讯人工智能领域的预研工作。他致力于 AI 和 5G 方向的研究,并在 2018 年被选为联合国国际电信联盟 ITU-T ML5G WG3 主席(机器学习应用于 5G 网络架构组)。同时他当选中国人工智能产业发展联盟总体组副组长,Linux AI & Data 基金会董事会成员,并于 2023 年成功当选 Linux AI & Data 基金会董事会主席。孟伟先生先后担任 Linux 基金会 ODL 项目的 PTL 及 Adlik 项目的 mentor,并且在 IETF 及 ITU-T 立项及发布多项国际标准,涉及人工智能及网络功能虚拟化方向。同时,他以第一作者获得中国及国际专利授权 30 余件。
当选为 LF AI&Data 基金会主席的这一年,孟伟已在标准与开源领域耕耘十余年。
2018 年 3 月, Linux 基金会成立子基金会 LF AI & Data 基金会(前身是深度学习基金)中兴通讯作为其十大创始成员之一,在推动 AI 生态发展上不遗余力。2019 年,中兴通讯在基金会孵化推理侧工具链开源项目 Adlik,吸引了国内外数十家公司参与社区生态建设。
而孟伟与开源结缘的时间还要更早,大学时,他就开始尝试用 Linux 服务器及开源工具搭建私有 VPN 和 NAS 系统,自 2015 年开始正式贡献社区,完成了从使用开源到贡献开源的角色转变。如今他称自己为“基金会的志愿者”,专注于 AI 大模型领域的开源与商业化等议题,建设 AI 生态的同时帮助更多开发者更好地拥抱开源。
本期《近匠》栏目邀请到新任 LF AI & Data 基金会董事会主席孟伟与大家分享他与开源、AI 共同成长的故事。
“基金会主席的角色更像是个志愿者”
CSDN:你在今年 6 月当选为 LF AI&Data 基金会主席,竞选过程中有哪些趣事可以分享?
孟伟:在 LF AI & Data 董事会中,中国人的比例相对其他全球基金会的董事会更高,中外人员各一半。竞选的过程可能不算有趣,在整个投票过程中,大家都很安静。投票全部匿名,只能看到最终结果的公布。竞选的流程则比较清晰,首先由基金会秘书公布提名流程。提名截止的一个星期后,开始全匿名投票,投票者必须直接发送到秘书邮箱里,因此提名者不知道到底谁投了赞成票或反对票。投票过程大约持续一个星期,投票截止一两天后就统计票数并公布。除此之外,竞选必须遵循一个原则:投票人数必须超过全员的一半以上,投票结果才有效。少于一半人投票,说明大家对此事积极性不高,那么投票无效。那时候我和基金会的工作人员积极与董事会成员保持沟通,让大家参与到投票活动中。基金会主席这个角色我理解更像是个志愿者,我愿意为大家服务,为开源社区服务。
CSDN:LF AI & Data 基金会创立背景、主要工作与目标是什么?
孟伟:2017 年下半年,Linux 基金会已经有了相关提议,准备筹建人工智能子基金会。那时人工智能非常火爆,国内外都出现了很多人工智能组织,如产业联盟和标准化组织。2017 年底至 2018 年年初,这些组织发展得风生水起。第一波人工智能浪潮兴起时,人们关注深度学习和神经网络,因此 Linux 基金会提议成立一个人工智能相关的子基金会——深度学习基金会,希望借深度学习的东风,使人工智能在开源领域生根发芽,带动行业发展,这就是 LF AI & Data 的前身。深度学习基金会刚成立时,只有不到 10 个项目,2019 年中兴通讯捐赠的 Adlik 是基金会的第六个项目,现在基金会已经有了近 70 个项目,成员也从最初的 10 多个到目前的 46 个。LF AI & Data 的使命是建立和支持开源开放的人工智能和数据的开源社区,为成员提供协作和创造的新机会,推动人工智能和数据领域的创新及行业落地。作为新任基金会主席,我非常希望基金会的成员数快速增长,在业界形成足够影响力,并推动人工智能包括当前非常火爆的大模型在行业内的落地。
在参与 LF AI & Data 的董事会工作以及 TAC 委员会工作中,国际知名基金会行事规范和准则让我深刻印象。以开会为例,每次开会时,会议主席都要重温一遍上次会议的纪要,但不会直接让大家举手表示赞同或反对,而是要求至少有两个投票人发起此次投票动议,即 first motion 和 second motion。如果没有人表态赞同,那么投票将被放弃。提前发起动议的方式能避免对话题展开无效投票,使会议高效进行。这是一种庄重且具仪式感的行为准则。
为开源强大的生命力着迷
CSDN:你是如何与开源结缘、走上开源道路的?
孟伟:最早接触到 Linux 并使用是在大学时期,同寝室的理工科学生都很有极客精神,在寝室里研究 Linux 系统和各种开源工具。我们搭建 Linux 服务器主要用于搭建私有 VPN 和 NAS 系统,在网吧里就可以访问寝室里硬盘上的数据,当时觉得非常酷。真正参与社区贡献以及开源社区活动始于 2015 年,在 Linux 基金会下属的 OpenDaylight(Linux 基金会的开源网络项目)社区,该项目被称为下一代网络操作系统,主要用于 SDN 控制器。我们为社区贡献的第一个开源项目是 OF-CONFIG。作为项目进入社区的答辩审核者,我在项目孵化成功后,一直以项目的 PTL(项目团队主管)的身份带领项目的研发,包括后续版本的迭代。OF-CONFIG 目前在 OpenDaylight 社区已经毕业,而 OpenDaylight 已经广泛应用于网络部署和运营行业中。
CSDN:在成为一个专业开源玩家的过程中,哪件事对你的影响比较大?
孟伟:闭源与开源的问题总被热烈讨论,我认为开源和闭源公司之间没有明显的界限。给我印象最深刻的一件事发生在 2016 年的某次开源峰会,传统闭源操作系统“老大哥”微软是本次会议的顶级赞助商,在 T 恤和徽章印上标语:Microsoft Love Linux!参与会议的我非常诧异,后来发现这正是开源的魅力,将世界上不同肤色、种族和行业的开发者聚集在一起,在社区畅所欲言。许多开源会议现场,参会者穿着拖鞋就过去了,是一个非常开放、随性的场合,穿西装打领带的人反而格格不入。留着长头发、扎辫子、穿着短裤、沙滩裤和拖鞋的参会者反而会给人一种大牛的感觉。开源文化将全世界的人才、开发者和天才聚集在一起,发挥出最大价值。这正是开源生命力强大的体现,也是我对开源保持热忱的原因之一。
CSDN:中兴何时开始做开源相关贡献?你所负责的标准和开源战略工作遇到过哪些挑战?
孟伟:中兴成立于 1985 年,早期中兴手机在国内非常知名。除了 Linux 以外,在 Android 刚起步时,中兴已经积极加入 Android 的开发社区贡献自己的代码。那个时候,大家不会刻意强调开源这件事,但会积极参与进来。
中兴标准战略委员会开源组有几十人,包括法务、安全、合规等,它不称为 OSPO,但行使着相似的职责。中兴认为开源是一个事实标准,因此我们将传统的标准和事实标准(开源)放在同一个战略体系下。开源组需要系统地识别出公司内部具有竞争力的开源项目,以及希望捐赠的项目,制定社区化运作方案以及推进开源生态的顶层设计。
其中确实存在一些难点。首先,中兴作为一家通信设备制造商,通信领域的开源项目数量与质量比不上操作系统、数据库领域的,但仍然具备一定规模。其次,中兴通讯正在拓展自身的 IT 能力,对数据库、操作系统和芯片设计进行大量研发。但许多团队原来专注于网络领域,思维可能还停留在网络定制化软件开发等方面,且团队间对开源的认知差异很大,因此未来的一项重要工作就是在公司内部进行开源布道,形成一种更开放的开源文化,增加开发者们对开源的认识与积极性。
大模型的开源与商业化目前仍处模糊地带
CSDN:AI 在不同领域的开源程度不同,框架和视觉板块开源较早,大模型相对而言则发展较慢,这背后的原因是什么?
孟伟:AI 的开源有很多方向,AI 框架是相当重要的领域,国内外都有很多优秀项目。现在的框架已经非常多,开发者需要很长时间才能适应新的框架,如果有更多能屏蔽底层框架、而不需要关注底层框架的工具就更好了。LF AI & Data 希望有更多优秀的 AI 工具出现,帮助企业数字化转型快速进行,帮助开发者更好地运用。通过 AI 工具实现项目版本的发布和功能实现等。大模型的开源是随着 ChatGPT 的火爆逐渐发展起来。近期我参加了数次业界论坛,在探讨是否需要开源大模型时,我的回答都是肯定的。当闭源的大模型成为业界标杆之后,底下的竞争者会纷纷开源,开源大模型将成为趋势。
CSDN:对于大模型的开源,你更关注哪些点?
孟伟:我比较关注开源大模型的商业化与开源协议等问题。目前 LLaMA 发展出了羊驼家族一系列大模型,但商用化方面可能存在一些问题。在 LLaMA2 出来之前,一些可以商用化的开源大模型,好用程度并不高。大模型开源,其形式是否与传统代码一样?问题没这么简单。开源一段自己写的代码,可以直接使用许可协议。但开源大模型里面包含算力投入、数据资产(可能是免费的数据集和购买的),涉及到隐私问题、数据流通问题以及安全问题,大模型开源面临的问题是还没有真正的规范和统一的许可证。
前段时间中东某国开发并发布在 HuggingFace 上的一个大模型引发了广泛争议。这个 400 亿参数的大模型 Falcon-40B 开源之后,其遵循的开源许可协议在开源圈引起了轩然大波,该许可证大部分基于 Apache License Version 2.0,对商业友好,使用者可以修改代码来满足需要,并作为开源或商业产品发布 / 销售。然而 Falcon 却修改了部分许可证规定:其开源大模型可以商用,但如果超过一定金额就需要支付相应费用。这一动作带来很大的争议,具有开源乌托邦精神的人认为这破坏了开源文化,但我个人认为这个动作道义上不正确,但可以理解,因为企业也有营收压力。这个现象最根本的原因是没有统一的许可协议来约定大模型开源应遵守什么样的规范?以及如何避免出现隐私问题、法律问题?这些都很敏感,企业一旦踩雷可能会付出昂贵的代价。
大模型的开源商业模式究竟在哪里?我们一直在思考。
有人分析过几种开源商业化路线,例如同时有开源版本和商业版本,开源的版本免费,如果需要更多服务和高级功能就需要购买商业版本,这是第一种商业版收费。第二种是服务收费,例如红帽,很多收入来源于其服务。我认为有商业诉求并不难以启齿。大模型开源的商业模式在哪里?为什么大模型要开源?价值在哪里?都需要进一步探讨,从而完善规范,使 AI 开源进程有序地进行,形成一个良性循环。
此外,现在已经开源的模型,其许可协议处于非常模糊的状态,若出现法律纠纷,在国际上也并没有可借鉴的案例。不过目前国家工信部下属的中国信息通信研究院和中国电子技术标准化研究院,以及各个行业的相关单位正在讨论大模型许可协议,中兴也参与其中。中国现在已经从重度参与游戏到制定游戏规则,这是非常大的进步。
开发者进阶三要素
CSDN:当前阶段 AI 技术发展非常火热,许多人在讨论程序员是否会被替代,你如何看待程序员与 AI 之间的关系?
孟伟:坦白说,我认为替代是不可避免的,尽管很多公司并没有明确表示正在进行这项工作。对于公司来说,人力成本是个巨大开销,因此都希望能缩减。如果能实现人力成本降低 10%或 20%,是非常了不起的成果,如此一来企业就有动力通过大模型来实现这一目标。大家也不必过于焦虑,每个时代都有一些吃香的行业专家和占优势的行业诞生。前段时间生成式 AI 岗位在国外激增 20%,国内的情况也是类似。你可以换个角度思考,切换赛道,研究生成式 AI、研究大模型,程序员可以努力提升自己,成为不可替代的一批人。不过程序员并不是最焦虑的,文字工作者的危机感应该更重,因为编写代码的难度可能比编写文字更大。目前来看,写文字或者进行一些同传翻译,利用 AI 工具现在已经非常方便。
CSDN:中国的开源发展目前处于怎样一个阶段,有哪些问题需要解决?
孟伟:中国目前的开源发展非常迅速,这是不可否认的。中国开发者数量已经位居全球前三。但我认为现在还没有到非常厉害的程度,面临较多的问题。
首先,成为参与者非常容易,但要成为规则制定者还有很长的路要走。开源玩法最先流行于国外,包括许可协议和议事规则。在很长一段时间之前,国内没有自己的许可证,例如 Apache、GPL 这些许可证都源自国外。不过,我国逐步研究并制定出木兰许可证这样的开源许可协议,逐渐从重度参与的角色向顶层规则制定的角色迁移。
第二个问题,社区大于代码。许多中国的工程师,从小到大接受中考、高考,一直保持学霸状态,直到从事程序员的工作。社区重于代码是指,若要形成一个活跃的社区,仅靠埋头工作,将“木器”雕刻成一朵花是不够的。开源社区更需要人与人之间的交流,一个活跃的社区会比精美的代码更重要。在国外参加一些标准和开源会议时,会议上的“麦霸”都是外国人,而中国人很少这样,大多数人都在台下记笔记,这是一个普遍现象。不仅仅是中国公司之间或人员内部的交流,更要走出去与国外优秀开发者交流。这是我们未来需要改善的地方。
第三个问题是语言,即英语。英语对大多数程序员来说并不是问题,写代码都是用英文写的。需要注意的是,交流不要去刻意在乎语法、口音是否正确。很多中国人与外国人交流时,总是在顾虑语法是否正确以及发音是否地道,这些问题都不是最重要的,勇敢地表达,外国人能理解你想表达的意思。
CSDN:对于想要进入开源领域的开发者,有什么话想说?
孟伟:从事开源是一个非常好的赛道,尤其是人工智能开源领域,开源会快速推动人工智能技术的进步。我认为情绪价值目前很难被人工智能取代。人们与机器人聊天,至少目前不会与它产生情绪上的依赖。首先,程序员必须走出自己的圈子,让自己的价值、知识和代码能够惠及他人,同时也能让情绪感染他人,这是每个人不可被取代的重点之一。
第二,必须学好英语。学好并不仅限于在编写代码或撰写邮件时,更重要的是能够表达。在今年 3 月份 Linux 基金会的大会,有件事情让我印象最深刻,一个英语不太好的同学一直与基金会的大佬聊天,后来这位同学表示是因为大佬人非常 nice,和他一起交流也是为了练习英语口语。很多程序员已经意识到了学好英语的重要性,开源事业终将面向国际,交流是不可或缺的。如果不太主动,很多机会可能就没有了。
第三点,在编写代码时,注释必须非常简洁易懂。在开源领域,你面对的是不同认知层次或不同行业的人,这些人可能不理解你为什么要编写这样的程序。中兴之前有一位研发领导建议编写程序时,一定要使用普通人都能看懂的语言,而不是一味的使用术语。如果初学者都能明白你写的注释的含义,那么这就是一段成功的注释。一定要养成这样的习惯:写注释是为了方便他人,也是为了让更多人快速融入到自己的项目中。
《近匠》是 CSDN 推出的访谈栏目,其意思即为「走近工匠」,走近深耕于开源、云、AIoT、根技术、数字化转型、前沿技术的工具创造者和技术管理者们,了解他们怎么看待现在的开发工作,分享自己精雕细琢出来的工具有何特点,剖析整个行业发展现状及未来趋势。
为此,基于开源、云、AIoT、根技术、数字化转型、前沿技术等领域,如果您及团队有报道需求,亦或者如果您有对技术趋势的真知灼见,或是深度的应用实践、场景方案等的新见解,欢迎联系 CSDN 投稿,联系方式:微信(hanbb120,请备注投稿+姓名+公司职位)、邮箱(tumin@csdn.net)。
推荐阅读:
▶苹果拒绝接口和安卓互通,违法也不在乎;马斯克承认𝕏公司可能失败;Debian支持龙芯LoongArch架构|极客头条
▶今年全球最大规模 IPO 或将诞生,芯片巨头 Arm 正式提交上市申请!
▶把Android手机变成电脑摄像头,开发者倒苦水:40行代码搞定,但需要40个项目文件支持!